其他
为什么同样的人类病人遗传隐私保护政策各个科学研究团队遵守情况不一样
分享是一种态度
最近接触的单细胞文献比较多,发现不同文章的测序数据公布的地方很不一样,有的不让下载,有的是需要授权审核才能下载,有的是完全公开下载。很有意思,分享一下:
有的是干脆不让下载
当我们想下载病人测序原始数据的时候,我们在很多文献,比如数据集GSE127465的文章,里面就看到这样的表述:
“The raw fastq files are only provided for mouse due to human patient privacy concerns.
这样的描述基本上就告别了数据下载的希望了。
有的是上传到EGA数据库或者dbGAP
比如:
再比如:
也有的是在SRA数据库公开下载
下面这个在SRA数据库就是可以完全公开下载,需要熟悉GEO和SRA数据库:
因为ncbi的sratoolkit有可能不好用,比如prefetch命令下载sra文件速度太慢,可以参考:使用ebi数据库直接下载fastq测序数据 , 需要自行配置好aspera从ebi下载的软件环境,就可以高速下载啦。
最小众的就是在中国区数据库
比如:
那么到底政策是什么呢?
各个国家地区政策不一样?各个实验室遵守规定的程度不一样?
10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析
使用R包SomaticSignatures进行denovo的signature推断
使用R包deconstructSigs根据已知的signature进行比例推断
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
生信爆款入门-第6期(线上直播4周,马拉松式陪伴,带你入门) 你的生物信息入门课
数据挖掘学习班第4期(线上直播3周,马拉松式陪伴,带你入门) 医学生/医生首选技能提高课
生信技能树的2019年终总结 你的生物信息成长宝藏
看完记得顺手点个“在看”哦!
长按扫码可关注